针对语音情感数据集规模小且数据维度高的特点,为解决传统循环神经网络(RNN)长程依赖消失和卷积神经网络(CNN)关注局部信息导致输入序列内部各帧之间潜在关系没有被充分挖掘的问题,提出一个基于多头注意力(MHA)和支持向量机(SVM)的神经网络MHA-SVM用于语音情感识别(SER)。首先将原始音频数据输入MHA网络来训练MHA的参数并得到MHA的分类结果;然后将原始音频数据再次输入到预训练好的MHA中用于提取特征;最后通过全连接层后使用SVM对得到的特征进行分类获得MHA-SVM的分类结果。充分评估MHA模块中头数和层数对实验结果的影响后,发现MHA-SVM在IEMOCAP数据集上的识别准确率最高达到69.6%。实验结果表明同基于RNN和CNN的模型相比,基于MHA机制的端到端模型更适合处理SER任务。
Hadoop集群单队列作业调度会产生短作业等待、资源利用率低的问题;采用多队列调度可兼顾公平、提高执行效率,但会带来手工配置参数、资源互占、算法复杂等问题。针对上述问题,提出三队列作业调度算法,利用区分作业类型、动态调整作业优先级、配置共享资源池、作业抢占等设计,达到平衡作业需求、简化一般作业调度流程、提升并行执行能力的目的。对短作业占比高,各作业占比均衡以及一般作业为主,偶尔出现长、短作业三种情况与先进先出(FIFO)算法进行了对比实验,结果三队列算法的运行时间均比FIFO算法要少。实验结果表明,在短作业聚集时,三队列算法的执行效率提升并不显著;但当各种作业并存且分布均衡时,效果很明显,这符合了算法设计时短作业优先、一般作业简化流程、兼顾长作业的初衷,提高了作业整体执行效率。
考虑到只依赖对极几何关系的匹配点余差并不能完全区分匹配点的正确与否,从而影响内点集选取的情况,提出基于三视图约束的基础矩阵估计算法。首先,使用传统随机抽样一致性(RANSAC)算法计算三视图的任意两对相邻图像间的基础矩阵,确定三视图中共有的匹配点对,并计算估计基础矩阵时非共用图像上的匹配点在共用图像上的极线;然后,计算两条极线的交点与共用图像上对应匹配点间的距离,以距离值的大小作为内点判断的依据,得到新的内点集。在新内点集的基础上,采用M估计算法重新计算基础矩阵。实验结果表明:该方法可以同时降低噪声和错误匹配对基础矩阵精确计算的影响,精度优于传统鲁棒性算法,使点到极线的距离限制在0.3个像素左右,而且计算结果具有稳定性,可以被广泛地应用到基于图像序列的三维重建和摄影测量等领域中。